NsightCompute是一个CUDAkernel分析器,它通过硬件计数器和软件收集指标。它使用内置的专业知识来检测kernel常见的性能问题并指出发生这些问题的位置并给出一些解决方法的建议。这一内置规则集和...
浏览 66 次 标签: CUDA-MODE 第一课课后实战(上)